Microsoft lança nova IA para diagnóstico: “Até 4x melhor que médicos”

A Microsoft apresentou hoje uma pesquisa que pode marcar uma virada na relação entre inteligência artificial e medicina.
Um projeto do grupo de trabalho de IA liderado por Mustafa Suleyman demonstrou a capacidade de diagnosticar corretamente 85% dos casos clínicos publicados no New England Journal of Medicine (um dos periódicos médicos mais prestigiados do mundo) . Isso, segundo ele, excede em mais de quatro vezes a taxa de precisão de um grupo de médicos especialistas.
“A equipe de IA da Microsoft compartilha pesquisas que demonstram como a IA pode examinar e resolver sequencialmente os desafios diagnósticos mais complexos na medicina”, diz um artigo publicado no site oficial da Microsoft, “casos que até mesmo médicos experientes acham difícil de resolver”.
A nova fronteira do diagnóstico sequencialO cerne da inovação do MAI?DxO (este é o nome do programa) reside na sua capacidade de replicar o raciocínio clínico passo a passo. Ou seja, exatamente como um médico faria na prática. Não se trata de responder a perguntas de múltipla escolha, mas de seguir um processo de diagnóstico real, partindo dos sintomas, fazendo perguntas específicas, solicitando exames e avaliando os resultados. Mais do que uma única análise, uma replicação relativamente precisa do raciocínio clínico.
“Na Microsoft AI, estamos trabalhando para aprimorar e avaliar as capacidades de raciocínio clínico. Para ir além das limitações dos testes de múltipla escolha, focamos no diagnóstico sequencial, que é a base da tomada de decisões médicas no mundo real”, continua o site na página que apresenta os resultados da pesquisa.
Um exemplo concreto entre os propostos no estudo. Segundo os pesquisadores, um paciente com tosse e febre poderia fazer com que o sistema decidisse primeiro solicitar exames de sangue e depois uma radiografia de tórax, antes de chegar ao diagnóstico correto de pneumonia, assim como um médico faria.
IA vs. Médicos: Software supera equipe humana em 85% a 20%A equipe utilizou 304 casos clínicos reais da série semanal Case Records do NEJM, transformando-os em um benchmark chamado SD Bench (Sequential Diagnosis Benchmark). O desempenho do MAI?DxO, que coordena grandes modelos de linguagem como OpenAI o3, Gemini, Claude, Grok e outros, surpreendeu os pesquisadores, que escreveram: "Comparando os resultados com casos reais publicados semanalmente no New England Journal of Medicine, mostramos que o Microsoft AI Diagnostic Orchestrator (MAI-DxO) diagnostica corretamente até 85% dos casos, mais de quatro vezes mais do que um painel de médicos especialistas."
Os 21 médicos envolvidos na avaliação – dos Estados Unidos e do Reino Unido – obtiveram uma média de 20% de diagnósticos corretos. O sistema da Microsoft também se mostrou mais econômico, optando por testes mais direcionados e menos invasivos. "O MAI-DxO chega ao diagnóstico correto de forma mais econômica do que os médicos", acrescentam.
Não é um substituto para o humano, mas um aprimoramentoA Microsoft fez questão de ressaltar que o MAI?DxO não tem como objetivo substituir médicos, mas apoiá-los nos casos mais difíceis ou quando há falta de acesso a especialistas.
“O papel dos médicos é muito mais amplo do que apenas diagnosticar. Eles devem ser capazes de lidar com situações ambíguas e construir confiança com os pacientes e suas famílias, algo que a IA não consegue fazer hoje”, continua.
A empresa admite que o sistema ainda não está pronto para uso clínico, mas acredita que no futuro poderá melhorar o acesso ao atendimento, reduzir erros e ajudar em situações particularmente complexas.
Rumo à “superinteligência” médicaHá uma expressão escolhida pela Microsoft para definir o caminho: "Caminho para a Superinteligência Médica" , um caminho para a superinteligência médica. O objetivo: uma IA que não apenas iguale, mas supere as capacidades humanas em diagnóstico, tratamento e previsão médica.
O artigo explica que "Adotar esse nível de raciocínio — e além — poderia mudar profundamente o sistema de saúde. A IA poderia ajudar os pacientes a gerenciar de forma autônoma aspectos simples de sua saúde e fornecer aos médicos suporte avançado para casos mais complexos."
A Microsoft anunciou que tornará o benchmark público para colaboração e verificação científica. Testes futuros se concentrarão em sintomas mais comuns para confirmar a confiabilidade em situações comuns.
O projeto surge num momento em que os gastos globais com saúde estão a disparar, com custos nos EUA - recorda o Guardian - a ultrapassar os 20% do PIB e onde até um quarto das despesas é considerado ineficiente.
La Repubblica